Why Use 40 Participants in Quantitative UX Research? 定量使用者體驗研究中的樣本量選擇:為什麼是40?
在定量研究中,選擇樣本數量是一個關鍵問題。如果樣本太少,結果可能不夠準確;如果樣本太多,又會浪費時間和資源。那麼,為什麼在許多使用者體驗(UX)研究中,推薦用40個樣本呢?這個數字並不是隨意的,而是基於統計學的原理和實際操作的平衡。
我們用一個簡單的例子——研究狗的耳朵型別,來一步步說明。

第一步:為什麼需要樣本?
假設我們想知道全世界狗中,垂耳和豎耳的比例。最理想的辦法是檢查每一隻狗,但這是不可能的。所以我們選擇一部分狗(樣本),用它們的資料來估算整個狗群的比例。
例如,我們發現70%的樣本狗是垂耳的。這時就出現一個問題:這個70%真的能代表所有狗嗎?換一組狗,可能是65%或75%。這說明樣本總會有一些誤差。
為了控制誤差並讓結果更可靠,我們引入了兩個關鍵概念:置信區間和置信水平。
第二步:置信區間和置信水平是什麼?
- 置信區間:它是一個範圍,用來表示結果可能接近真實值的區間。
比如,我們測得 70% 的狗是垂耳的,但加上誤差後,真實比例可能在 55% 到 85% 之間。這就是置信區間(70% ± 15%)。區間越窄,結果越精確。
- 置信水平:它表示我們對結果的信心程度。
比如,95% 的置信水平意味著:如果我們重複研究100次,其中95次的真實值會落在置信區間內。它反映了結果的可靠性。你可以說我有95%的信心,真實值會落在志鑫區間內。
在使用者體驗研究中,我們通常選擇95% 的置信水平和15% 的誤差範圍,因為這在準確性和成本之間取得了平衡。
第三步:為什麼40個樣本能滿足這些要求?
為了實現95% 的置信水平和15% 的誤差範圍,我們需要計算樣本數量。這涉及一個簡單的統計公式:

其中:
- ZZ:與置信水平相關的常數(95% 對應1.96)。
- pp:樣本中目標特徵的比例(這裡假設垂耳比例為0.5,最不確定時的保守估計)。
- EE:允許的誤差範圍(15%,即 0.15)。
代入公式:

計算結果是39個樣本。為了保險起見(比如防止參與者中途退出),我們取整到40。
第四步:為什麼不是更多或更少?
- 為什麼不是更多?
增加樣本數量可以提高精確度,但收益是遞減的。比如,要把誤差從15%減小到10%,可能需要超過100個樣本,這對時間和成本的要求就會大幅增加。
- 為什麼不是更少?
如果樣本不足,比如只有10個,誤差範圍會非常大(約30%),結果不夠可靠,也很難指導實際工作。
第五步:為什麼40適合定量UX研究?
在使用者體驗研究中,40個樣本是一個理想的起點,原因包括:
- 可靠性:40個樣本可以保證95% 的置信水平和15% 的誤差範圍,足夠支援大多數研究需求。
- 操作性:40個參與者的招募和管理相對簡單,不會對時間和預算造成過多壓力。
- 普適性:這個數字適用於大多數二後設資料(如任務成功率、點選率等),可以作為定量研究的通用參考。
選擇40個樣本是基於統計學公式計算出的結果,能在可靠性和實際操作性之間找到最佳平衡。它既能提供足夠準確的結果,又不會浪費太多資源。如果需要更高的精確度,可以根據具體情況調整樣本數量,但40是一個非常穩妥的起點。